[Day 06] urllib-03

DAY 6

從魯蛇到蟒蛇--網頁（站）靜（動）態分析工具開發系列第 6 篇

python 鐵人賽

seconddim

2014-09-27 20:40:39

2268 瀏覽

分享至

今天是google生日耶！祝它16歲生日快樂~

今日學習目標，網址的分析，在python3可以使用 urllib.parse 模組

https://www.my-website.idv.tw:8080/testpage.php?get=val#hash

分析一下上述的網址，不需要麻煩的正規表示式，只需要使用模組就好！﹝模組萬歲！﹞

import urllib.parse

targeturl = "https://www.my-website.idv.tw:8080/testpage.php?get=val#hash"

obj = urllib.parse
data = obj.urlparse( targeturl )

print( data )

print( data.scheme )
print( data.netloc )
print( data.path )
print( data.params )
print( data.query )
print( data.fragment )

學這些模組的使用並不難，google一下，多翻點書，找點範例，勤勞一點，連我這種不聰明的人都能學會XD

同場加映，POST 和 GET 傳送資料時，需要先 urlencode ，為什麼 python 的含數名稱不用 urldecode / urlencode 就好？

data2 = obj.quote( targeturl )
print( data2 )

data3 = obj.unquote( data2 )
print( data3 )

這兩天一直遇到編碼問題，在python上處理總是遇到許多困擾，utf8轉ascii啦！urlencode decode 啦！最後雖然達成目標編碼，總覺得用的不是很順手，有待訓練...
上述的編碼已經難倒我了！現在又遇上十六進位轉ascii等等的問題，真是一個頭兩個大！

繼續和 /x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0 搏鬥去...

以上，也向現在還在工作的工程師致敬！

[Day 05] urllib-02

[Day 07] urllib-04

系列文

從魯蛇到蟒蛇--網頁（站）靜（動）態分析工具開發共 30 篇

RSS系列文訂閱系列文

8 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

從魯蛇到蟒蛇--網頁（站）靜（動）態分析工具開發系列 第 6 篇

[Day 06] urllib-03

尚未有邦友留言

標記使用者

從魯蛇到蟒蛇--網頁（站）靜（動）態分析工具開發系列第 6 篇